檢索結果:共12筆資料 檢索策略: "王新民".ccommittee (精準) and cadvisor.raw="陳冠宇"
個人化服務 :
排序:
每頁筆數:
已勾選0筆資料
1
本論文介紹了多個膾炙人口的端到端語音辨識模型,從一開始出現的Connectionist Temporal Classification(CTC)模型、Recurrent Neural Network…
2
本論文研究了階層式及分類器混合這兩種複合式的分類器結構,用於提升音樂曲風分類之正確率。首先我們對輸入的樂曲分析出四種頻域特徵,分別是梅爾頻譜,梅爾倒頻譜,調變頻譜及打擊音效頻譜,作為基礎聲學特徵;然…
3
本論文介紹了多個膾炙人口的語言模型,從傳統的N連語言模型(N-gram Language Model)、緩存語言模型(Cache Language Model),到以神經網路為基礎的前饋神經網路語言…
4
本論文針對口語問答系統之需求,在BERT(Bidirectional Encoder Representations from Transformers)的架構上,將文本與音訊特徵一起學習,並命名為…
5
近年來,多語言問答已經成為一項新興的研究議題,並引起了廣泛的關注。仰賴於各種基於深度學習的先進技術,面向英文及其他資源豐富的語言所開發的系統有著高度的發展,但面向資源匱乏的語言時,這些技術大多因為資…
6
關鍵詞檢測系統是智慧裝置中重要的人機互動媒介。然而,要求關鍵詞檢測模型在少量參數的情況下,依然擁有著強健的性能表現,是非常具有挑戰性的。因此,在本論文中,我們設計了一個新穎的輕量化關鍵詞檢測模型-C…
7
自動語音辨識模型(Automatic speech recognition, ASR)的目的是將語音訊號轉換為對應的文字,其對聲學的特徵和文字的前後文意有著很強的學習能力才能夠整合語音與文字兩個模態…
8
由於多媒體數據和許多語音應用的問世,像是語音助理Alexa、Siri,這些應用已經充斥在我們的日常生活,檢索多媒體內容以滿足用戶查詢的語音文件檢索任務已經越來越受到重視。目前基於預訓練深層雙向模型(…
9
基於 Transformer 的模型在各大研究領域中都帶來了重大的創新,例如:語音訊號處理、自然語言處理和計算機視覺等。在 Transformer 被提出之後,基於注意力機制的端到端自動語音識別模型…
10
近幾年來,隨著網路的發達,每天都有成千上萬張新圖片或新影片產生,如何快速檢索出我們需要的資料,儼然成為一個熱議的問題,而此類問題可統稱為「圖片檢索」。圖片檢索的意義在於找出與檢索(Query)相似或…